- 首先我们将给出一个源自真实业界需求的案例场景。
- 围绕该上述场景,我们将介绍该场景中可用的关联分析、因果分析方法,并给出相关的方法分类
- 对于经典方法(基于频繁项挖掘)和与我们的研究相关的方法(基于图嵌入),本文也将列出相关的综述与论文列表。
- 在本文的研究范围之外,本文也列出了“事件序列-事件序列”关联分析、“事件序列-时间序列”关联分析的相关方法。
- 给定需要优化的网络性能指标,确定有哪些参数(组)将影响该指标;
- 给定要调整的网络参数,分析该参数将影响哪些指标。
- 移动网络的建设过程分为:规划、建设、维护、优化,四个步骤,我们的研究属于优化环节。
- 网络配置参数分为:非协同类参数(参数调整后只影响本小区的网络性能)、协同类参数(参数调整后会影响邻区网络性能)
- 调整协同类参数的具体场景包括:切换类与负载均衡类的网络性能优化,RF参数优化

- 上述分类是针对本文的研究目标进行的分类,事实上“基于相似度”、“基于相关性”、“基于图模型 - 基于回归模型”的方法属于属于关联分析,“基于图模型”分类下的“基于条件约束”、“基于得分”、“基于函数式模型”的方法属于因果分析。
- 因果分析的分类依据、以及介绍可参照[12][13][14]
Apriori最早由 Agrawal 提出,通过多次迭代建立候选集查找频繁项。在[15]中,作者对大规模操作系统中事件序列间的相关性进行了研究,为了方便对事件序列的相关性进行研究,作者首先将冗长的事件转化为不同的事件类型,并根据事件类型序列数据定义了“episode”。记在时间窗口 TW 内发生的所有事件类型即为一个 episode,并记为$E_{eA}, T_{eA}$,其中$E_{eA}$为与事件𝑒A相邻的所有事件的集合,$T_{eA}$为对应的时间窗口。然后,文中用频繁项查找算法 Apriori 对 episode 序列中频繁项集进行搜索,而这种频繁项集的形式就被认定为事件之间的相关性。文中利用不同 h-置信度与 Apriori 中修剪压缩比的变化曲线关系,自动求出最适宜的最小支持度,从而对频繁项集进行修剪。
HJ Lu[16]认为经典的关联规则挖掘忽略了事物发生的语境,如时间、地点等。作者认为项目关联有两种:
2)不同事物间的频繁项关联(如 A 股票第一天涨了后,B 股票在第四天有较大概率也涨)。
但由于 Apriori 算法每一次增加频繁项集大小时都需要重新扫描整个数据集,所以当数据集很大时,算法效率较低,因此有许多研究是针对如何将Apriori 算法进行优化提速。
如[17]研究了频繁项挖掘算法在 MapReduce 框架中的实现。文献[17]将串行的Apriori算法转化为分布式的MapReduce版本,在每一次查找频繁项集时,使用map生成候选支持,并用reduce收集全局的候选支持。并且算法可以根据候选对象的数量与前一个MapReduce阶段的执行时间,动态的收集可变长度的候选对象,极大地缩短了Apriori生成频繁项集的时间。
频繁模式生长算法(FP-growth)是最早由韩家炜等人提出的利用频繁模式树进行频繁项挖掘的算法。相比Apriori,FP-growth只用遍历两遍数据,且不需要产生候选序列,极大提高了挖掘效率。因此也有许多研究人员通过 FP-growth 来挖掘序列中的频繁项。
而传统的Apriori和FP-growth 算法都是基于最小支持度的频繁项搜索算法,因此存在以下两个问题:
对于 FP-Growth 算法,由于每个项目都有最低支持度,因此用户很难一次为所有的项目设置适当的阈值,所以用户通常需要多次优化算法的参数,直到达到满意的结果。
- 发生异常时的图anomaly graph使用$G=(V, E)$来表示,其中$C \cup A$。
- $C$是系统的组件构成的集合,包含系统中的逻辑组件、物理组件等,$A$是底层异常检测结果报告的异常(包括由规则定义的和由实时监控系统得到的),$E$是anomaly graph中的边集合,
- 图中存在两种边:1)连接组件的边,代表组件之间的从属关系;2)连接组件与异常的边,代表某个组件产生了某个异常
- 本文还为alarm edge设置了分数,代表了某个组件发生某个异常的严重程度,这个分数由:1)某个时间段内该异常每次发生的严重程度;2)该异常的发生频率,共同决定。
- 节点表示虚拟机VM
- 边表示节点之间的两种关系
- 由service call引起的业务关联
- 由于在同一个物理主机上而可能产生资源竞争的
- walker总是更倾向于往具有更高similarity的节点去游走
- walker游走到低similarity的节点的时候,可以选择返回
- walker的领域均为低similarity的节点时,可以选择待着不动
Arzani, B., Ciraci, S., Loo, B. T., Schuster, A., & Outhred, G. (2016, August). Taking the blame game out of data centers operations with netpoirot. In Proceedings of the 2016 ACM SIGCOMM Conference (pp. 440-453).
Gao, J., Yaseen, N., MacDavid, R., Frujeri, F. V., Liu, V., Bianchini, R., … & Arzani, B. (2020, July). Scouts: Improving the Diagnosis Process Through Domain-customized Incident Routing. In Proceedings of the Annual conference of the ACM Special Interest Group on Data Communication on the applications, technologies, architectures, and protocols for computer communication (pp. 253-269).